Model Selection

Ternary quantization compression

# Ternary quantization compression

Minicpm4 8B GGUF

MiniCPM4 is an efficient large language model designed specifically for edge devices. While maintaining optimal performance at the same scale, it achieves extreme efficiency improvements, enabling over 5x generation acceleration on typical edge chips.

Large Language Model

Transformers Supports Multiple Languages

Minicpm4 8B Marlin Vllm

MiniCPM4 is an efficient large language model designed specifically for edge devices, achieving extreme efficiency improvements and optimal performance at the same scale.

Large Language Model

Transformers Supports Multiple Languages

MiniCPM4 is an efficient large - language model designed specifically for edge devices. Through systematic innovation, it achieves extreme efficiency improvements in four key dimensions: model architecture, training data, training algorithm, and inference system.

Large Language Model

Transformers Supports Multiple Languages

MiniCPM4 is an efficient large language model designed specifically for edge devices. Through systematic innovation, it achieves extreme efficiency improvements in four dimensions: model architecture, training data, training algorithm, and inference system. It can achieve over 5 times faster generation speed on edge chips.

Large Language Model

Transformers Supports Multiple Languages

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase